该工作介绍了基于加强学习的开关控制机构,以在存在干扰的情况下自动地将铁磁物体(代表毫师机器人代表毫师机器人)围绕受约束的环境中的障碍物移动。当主动控制是必要的情况时,这种机制可用于导航通过复杂环境的物体(例如,胶囊内窥镜检查,药物颗粒的群体),但是直接操纵可能危险。所提出的控制方案包括由两个子控制器实现的交换控制架构。第一子控制器设计用于采用机器人的逆运动液解决方案来进行待携带的铁磁颗粒的环境搜索,同时稳健。第二子控制器使用定制的彩虹算法来控制机器人臂,即UR5机器人,通过受约束的环境将铁磁颗粒携带到所需位置。对于定制的彩虹算法,采用来自隐式定位网络(IQN)算法和RESET的定量Huber丢失。所提出的控制器首先在实时物理仿真引擎(Pybullet)中进行培训和测试。之后,训练有素的控制器被转移到UR5机器人,以在真实的情况下远程运输铁磁粒子,以证明所提出的方法的适用性。实验结果显示了98.86 \%的平均成功率计算出30个随机产生的轨迹的发作。
translated by 谷歌翻译